其他
我们想研发一个机器学习框架,6 个月后失败了
我们使用Kaggle数据集为机器学习管道的数据接收、训练、部署等不同阶段编写了抽象。 我们将代码库开源并共享。一个月后,我们的项目登上了HN的首页。每个人都喜欢那些改进机器学习用户体验的想法。 六个月后,我们只收获了几百颗GitHub星星,几乎没有人使用它。我们不得不将我们的傲气搁到一边,删除了代码库中90%的代码。
为什么想构建端到端的机器学习框架?
$ deploy recommendation_engine
PyTorch已经从一个仅仅前景看好的项目发展成为最流行的机器学习框架,在此期间许多专门的机器学习训练库(如微软的DeepSpeed)已经发布出来。
OpenAI发布了有史以来最大的模型,可以运行带有15亿个参数的GPT-2。此后,谷歌、Salesforce、微软和Nvidia都发布了更大的机型(有些是同一数量级的)。
大量初创企业已经开始使用迁移学习(Transfer Learning)和预训练模型来优化和部署具有少量数据的模型(比如说,并非每个人现在都需要一个100节点的Spark群集)。
专注于模型服务基础设施
将web开发经验应用到机器学习工具中
更多精彩推荐